HTMLSyntax.java example

Explorer
damp.ekeko.snippets-master
- damp.ekeko.snippets.plugin
  - src
    - damp
      - ekeko
        snippets
        BoundDirective.java
        DirectiveOperandBinding.java
        EkekoSnippetsPlugin.java
        ExtractedSnippet.java
        NaiveASTFlattener.java
        OperatorOperandBinding.java
        SnippetBaseListener.java
        SnippetBaseVisitor.java
        SnippetExtractor.java
        SnippetLexer.java
        SnippetListener.java
        SnippetParser.java
        SnippetVisitor.java
        data
        SnippetOperator.java
        TemplateGroup.java
        geneticsearch
        PartialJavaProjectModel.java
        gui
        BoundDirectivesEditorDialog.java
        BoundDirectivesViewer.java
        ChartCanvas.java
        ClojureFileEditorInput.java
        DirectiveOperandBindingEditingSupport.java
        DirectiveOperandBindingLabelProviderValue.java
        DirectiveSelectionDialog.java
        IntendedResultsEditor.java
        IntendedResultsEditorCommandHandler.java
        IntendedResultsEditorInput.java
        IntendedResultsEditorPersistableElementFactory.java
        MutationHistoryDialog.java
        OperandBindingLabelProviderDescription.java
        OperatorOperandBindingEditingSupport.java
        OperatorOperandBindingLabelProviderValue.java
        OperatorOperandsView.java
        OperatorOperandsViewer.java
        OperatorTreeContentProvider.java
        OperatorTreeLabelProvider.java
        PopulationInspectorDialog.java
        QueryInspectorDialog.java
        RecommendationEditor.java
        RecommendationEditorCommandHandler.java
        RecommendationEditorInput.java
        RecommendationEditorPersistableElementFactory.java
        RewritesTemplateEditor.java
        SubjectsTemplateEditor.java
        TemplateCodeGenerator.java
        TemplateEditor.java
        TemplateEditorActionBarContributor.java
        TemplateEditorCommandHandler.java
        TemplateEditorInput.java
        TemplateEditorPersistableElementFactory.java
        TemplateGroupNodeSelectionDialog.java
        TemplateGroupTemplateElement.java
        TemplateGroupViewer.java
        TemplateGroupViewerNodeDoubleClickListener.java
        TemplateGroupViewerNodeSelectionEvent.java
        TemplateGroupViewerNodeSelectionListener.java
        TemplatePrettyPrinter.java
        TemplateTreeContentProvider.java
        TemplateTreeLabelProviders.java
        TransformationEditor.java
        TransformationEditorActionBarContributor.java
        TransformationEditorCommandHandler.java
        TransformationEditorInput.java
        TransformationEditorPersistableElementFactory.java
        TransformationOverviewEditor.java
    - ec
      - util
        MersenneTwister.java
- damp.ekeko.snippets.plugin.test
  - resources
  - src
    - test
      - damp
        ekeko
        snippets
        EkekoSnippetsTest.java
        experiments
        GeneticSearchTest.java
/*
 *                 Sun Public License Notice
 * 
 * The contents of this file are subject to the Sun Public License
 * Version 1.0 (the "License"). You may not use this file except in
 * compliance with the License. A copy of the License is available at
 * http://www.sun.com/
 * 
 * The Original Code is Forte for Java, Community Edition. The Initial
 * Developer of the Original Code is Sun Microsystems, Inc. Portions
 * Copyright 1997-2000 Sun Microsystems, Inc. All Rights Reserved.
 */

package org.netbeans.editor.ext;

import org.netbeans.editor.Syntax;

/**
* Lexical anlyzer for HTML source files.
*
* @author Miloslav Metelka
* @version 1.00
*/

public class HTMLSyntax extends Syntax {

    /** Internal state of the lexical analyzer before entering subanalyzer of
     * character references. It is initially set to INIT, but before first usage,
     * this will be overwritten with state, which originated transition to
     * charref subanalyzer.
    */
    protected int subState = INIT;

    // Token names
    public static final String TN_TEXT = "html-text"; // NOI18N
    public static final String TN_WS = "html-ws"; // NOI18N
    public static final String TN_ERROR = "html-error"; // NOI18N
    public static final String TN_TAG = "html-tag"; // NOI18N
    public static final String TN_ARGUMENT = "html-argument"; // NOI18N
    public static final String TN_OPERATOR = "html-operator"; // NOI18N
    public static final String TN_VALUE = "html-value"; // NOI18N
    public static final String TN_BLOCK_COMMENT = "html-block-comment"; // NOI18N
    public static final String TN_SGML_COMMENT = "html-sgml-comment"; // NOI18N
    public static final String TN_DECLARATION = "html-sgml-declaration"; // NOI18N
    public static final String TN_CHARACTER = "html-character"; // NOI18N

    // Token IDs
    /** Plain Text*/
    public static final int TEXT = 0;
    // Whitespace in Tags
    public static final int WS = 1;
    /** Erroneous Text */
    public static final int ERROR = 2;
    /** Html Tag */
    public static final int TAG = 3;
    /** Argument of a tag */
    public static final int ARGUMENT = 4;
    /** Operators - '=' between arg and value */
    public static final int OPERATOR = 5;
    /** Value - value of an argument */
    public static final int VALUE = 6;
    /** Block comment */
    public static final int BLOCK_COMMENT = 7;
    /** SGML comment - e.g. in DOCTYPE */
    public static final int SGML_COMMENT = 8;
    /** SGML declaration in HTML document - e.g. <!DOCTYPE> */
    public static final int DECLARATION = 9;
    /** Character reference, e.g. &lt; = < */
    public static final int CHARACTER = 10;


    // Internal states
    private static final int ISI_TEXT = 1;    // Plain text between tags
    private static final int ISI_ERROR = 2;   // Syntax error in HTML syntax
    private static final int ISA_LT = 3;      // After start of tag delimiter - "<"
    private static final int ISA_SLASH = 4;   // After ETAGO - "</"
    private static final int ISI_ENDTAG = 5;  // Inside endtag - "</[a..Z]+"
    private static final int ISP_ENDTAG_X = 6;  // X-switch after ENDTAG's name
    private static final int ISP_ENDTAG_WS = 7; // In WS in ENDTAG - "</A_ _>"
    private static final int ISI_TAG = 8;     // Inside tag - "<[a..Z]+"
    private static final int ISP_TAG_X = 9;   // X-switch after TAG's name
    private static final int ISP_TAG_WS = 10; // In WS in TAG - "<A_ _...>"
    private static final int ISI_ARG = 11;    // Inside tag's argument - "<A h_r_...>"
    private static final int ISP_ARG_X = 12;  // X-switch after ARGUMENT's name
    private static final int ISP_ARG_WS = 13; // Inside WS after argument awaiting '='
    private static final int ISP_EQ = 14;     // X-switch after '=' in TAG's ARGUMENT
    private static final int ISP_EQ_WS = 15;  // In WS after '='
    private static final int ISI_VAL = 16;    // Non-quoted value
    private static final int ISI_VAL_QUOT = 17;   // Single-quoted value - may contain " chars
    private static final int ISI_VAL_DQUOT = 18;  // Double-quoted value - may contain ' chars
    private static final int ISA_SGML_ESCAPE = 19;  // After "<!"
    private static final int ISA_SGML_DASH = 20;    // After "<!-"
    private static final int ISI_HTML_COMMENT = 21; // Somewhere after "<!--"
    private static final int ISA_HTML_COMMENT_DASH = 22;  // Dash in comment - maybe end of comment
    private static final int ISI_HTML_COMMENT_WS = 23;  // After end of comment, awaiting end of comment declaration
    private static final int ISI_SGML_DECL = 24;
    private static final int ISA_SGML_DECL_DASH = 25;
    private static final int ISI_SGML_COMMENT = 26;
    private static final int ISA_SGML_COMMENT_DASH = 27;
    private static final int ISA_REF = 28;    // when comes to character reference, e.g. &, after &
    private static final int ISI_REF_NAME = 29; // if the reference is symbolic - by predefined name
    private static final int ISA_REF_HASH = 30; // for numeric references - after &#
    private static final int ISI_REF_DEC = 31;  // decimal character reference, e.g. ř
    private static final int ISA_REF_X = 32;    //
    private static final int ISI_REF_HEX = 33;  // hexadecimal reference, in 
.. of 	..


    public HTMLSyntax() {
        highestTokenID = CHARACTER;
    }

    private final boolean isAZ( char ch ) {
        return( (ch >= 'a' && ch <= 'z') || (ch >= 'A' && ch <= 'Z') );
    }

    private final boolean isName( char ch ) {
        return( (ch >= 'a' && ch <= 'z') ||
                (ch >= 'A' && ch <= 'Z') ||
                (ch >= '0' && ch <= '9') ||
                ch == '-' || ch == '_' || ch == '.' || ch == ':' );

    }

    /**
     * Resolves if given char is whitespace in terms of HTML4.0 specs
     * According to specs, following characters are treated as whitespace:
     * Space - <CODE>'\u0020'</CODE>, Tab - <CODE>'\u0009'</CODE>,
     * Formfeed - <CODE>'\u000C'</CODE>,Zero-width space - <CODE>'\u200B'</CODE>.
     *
     * Carriage return - <CODE>'\u000D'</CODE> and Line feed - <CODE>'\u000A'</CODE>
     * are considered WhiteSpace too, but we handle linebreaks specially
     */

    private final boolean isWS( char ch ) {
        return ( ch == '\u0020' || ch == '\u0009' || ch == '\u000c' || ch == '\u200b');
    }

    protected int parseToken() {
        char actChar;

        while(offset < stopOffset) {
            actChar = buffer[offset];


            switch( state ) {
            case INIT:              // DONE
                switch( actChar ) {
                case '\n':
                    offset++;
                    return EOL;
                case '<':
                    state = ISA_LT;
                    break;
                case '&':
                    state = ISA_REF;
                    subState = ISI_TEXT;
                    break;
                default:
                    state = ISI_TEXT;
                    break;
                }
                break;

            case ISI_TEXT:        // DONE
                switch( actChar ) {
                case '\n':
                case '<':
                case '&':
                    state = INIT;
                    return TEXT;
                }
                break;

            case ISI_ERROR:      // DONE
                offset++;
                state = INIT;
                return ERROR;

            case ISA_LT:         // PENDING other transitions - '?'
                if( isAZ( actChar ) ) {   // <'a..Z'
                    state = ISI_TAG;
                    break;
                }
                switch( actChar ) {
                case '/':               // ETAGO - </
                    state = ISA_SLASH;
                    break;
                case '>':               // Empty start tag <>, RELAXED
                    offset++;
                    state = INIT;
                    return TAG;
                case '!':
                    state = ISA_SGML_ESCAPE;
                    break;
                default:                // Part of text, RELAXED
                    state = ISI_TEXT;
                    continue;             // don't eat the char, maybe its '\n'
                }
                break;

            case ISA_SLASH:        // DONE
                if( isAZ( actChar ) ) {   // </'a..Z'
                    state = ISI_ENDTAG;
                    break;
                }
                switch( actChar ) {
                case '>':               // Empty end tag </>, RELAXED
                    offset++;
                    state = INIT;
                    return TAG;
                default:                // Part of text, e.g. </3, </'\n', RELAXED
                    state = ISI_TEXT;
                    continue;             // don'e eat the char
                }
                //break;

            case ISI_ENDTAG:        // DONE
                if( isName( actChar ) ) break;    // Still in endtag identifier, eat next char
                state = ISP_ENDTAG_X;
                return TAG;


            case ISP_ENDTAG_X:      // DONE
                if( isWS( actChar ) ) {
                    state = ISP_ENDTAG_WS;
                    break;
                }
                switch( actChar ) {
                case '>':               // Closing of endtag, e.g. </H6 _>_
                    offset++;
                    state = INIT;
                    return TAG;
                case '<':               // next tag, e.g. </H6 _<_, RELAXED
                    state = INIT;
                    continue;
                case '\n':
                    offset++;
                    return EOL;
                default:
                    state = ISI_ERROR;
                    continue; //don't eat
                }
                //break;

            case ISP_ENDTAG_WS:      // DONE
                if( isWS( actChar ) ) break;  // eat all WS
                state = ISP_ENDTAG_X;
                return WS;


            case ISI_TAG:        // DONE
                if( isName( actChar ) ) break;    // Still in tag identifier, eat next char
                state = ISP_TAG_X;
                return TAG;

            case ISP_TAG_X:     // DONE
                if( isWS( actChar ) ) {
                    state = ISP_TAG_WS;
                    break;
                }
                if( isAZ( actChar ) ) {
                    state = ISI_ARG;
                    break;
                }
                switch( actChar ) {
                case '/':
                case '>':
                    offset++;
                    state = INIT;
                    return TAG;
                case '<':
                    state = INIT;
                    continue;       // don't eat it!!!
                case '\n':
                    offset++;
                    return EOL;
                default:
                    state = ISI_ERROR;
                    continue;
                }
                //break;

            case ISP_TAG_WS:        // DONE
                if( isWS( actChar ) ) break;    // eat all WS
                state = ISP_TAG_X;
                return WS;

            case ISI_ARG:           // DONE
                if( isName( actChar ) ) break; // eat next char
                state = ISP_ARG_X;
                return ARGUMENT;

            case ISP_ARG_X:
                if( isWS( actChar ) ) {
                    state = ISP_ARG_WS;
                    break;
                }
                if( isAZ( actChar ) ) {
                    state = ISI_ARG;
                    break;
                }
                switch( actChar ) {
                case '/':
                case '>':
                    offset++;
                    state = INIT;
                    return TAG;
                case '<':
                    state = INIT;
                    continue;           // don't eat !!!
                case '=':
                    offset++;
                    state = ISP_EQ;
                    return OPERATOR;
                case '\n':
                    offset++;
                    return EOL;
                default:
                    state = ISI_ERROR;
                    continue;
                }
                //break;

            case ISP_ARG_WS:
                if( isWS( actChar ) ) break;    // Eat all WhiteSpace
                state = ISP_ARG_X;
                return WS;

            case ISP_EQ:
                if( isWS( actChar ) ) {
                    state = ISP_EQ_WS;
                    break;
                }
                if( isName( actChar ) ) {
                    state = ISI_VAL;
                    break;
                }
                switch( actChar ) {
                case '\'':
                    state = ISI_VAL_QUOT;
                    break;
                case '"':
                    state = ISI_VAL_DQUOT;
                    break;
                case '\n':
                    offset++;
                    return EOL;
                default:
                    state = ISI_ERROR;
                    continue;
                }
                break;

            case ISP_EQ_WS:
                if( isWS( actChar ) ) break;    // Consume all WS
                state = ISP_EQ;
                return WS;


            case ISI_VAL:
                if( isName( actChar ) ) break;  // Consume whole value
                state = ISP_TAG_X;
                return VALUE;

            case ISI_VAL_QUOT:
                switch( actChar ) {
                case '\'':
                    offset++;
                    state = ISP_TAG_X;
                    return VALUE;
                case '\n':
                    if( offset == tokenOffset ) {
                        offset++;
                        return EOL;
                    } else {
                        return VALUE;
                    }
                case '&':
                    if( offset == tokenOffset ) {
                        subState = state;
                        state = ISA_REF;
                        break;
                    } else {
                        return VALUE;
                    }
                }
                break;  // else simply consume next char of VALUE

            case ISI_VAL_DQUOT:
                switch( actChar ) {
                case '"':
                    offset++;
                    state = ISP_TAG_X;
                    return VALUE;
                case '\n':
                    if( offset == tokenOffset ) {
                        offset++;
                        return EOL;
                    } else {
                        return VALUE;
                    }
                case '&':
                    if( offset == tokenOffset ) {
                        subState = state;
                        state = ISA_REF;
                        break;
                    } else {
                        return VALUE;
                    }
                }
                break;  // else simply consume next char of VALUE



            case ISA_SGML_ESCAPE:       // DONE
                if( isAZ(actChar) ) {
                    state = ISI_SGML_DECL;
                    break;
                }
                switch( actChar ) {
                case '-':
                    state = ISA_SGML_DASH;
                    break;
                default:
                    state = ISI_TEXT;
                    continue;
                }
                break;

            case ISA_SGML_DASH:       // DONE
                switch( actChar ) {
                case '-':
                    state = ISI_HTML_COMMENT;
                    break;
                default:
                    state = ISI_TEXT;
                    continue;
                }
                break;

            case ISI_HTML_COMMENT:        // DONE
                switch( actChar ) {
                case '\n':
                    if (offset == tokenOffset) { // no char
                        offset++;
                        return EOL;
                    } else { // return block comment first
                        return BLOCK_COMMENT;
                    }
                case '-':
                    state = ISA_HTML_COMMENT_DASH;
                    break;
                }
                break;

            case ISA_HTML_COMMENT_DASH:
                switch( actChar ) {
                case '-':
                    state = ISI_HTML_COMMENT_WS;
                    break;
                default:
                    state = ISI_HTML_COMMENT;
                    continue;
                }
                break;

            case ISI_HTML_COMMENT_WS:       // DONE
                if( isWS( actChar ) ) break;  // Consume all WS
                switch( actChar ) {
                case '\n':
                    if (offset == tokenOffset) { // no char
                        offset++;
                        return EOL;
                    } else { // return block comment first
                        return BLOCK_COMMENT;
                    }
                case '>':
                    offset++;
                    state = INIT;
                    return BLOCK_COMMENT;
                default:
                    state = ISI_ERROR;
                    return BLOCK_COMMENT;
                }
                //break;

            case ISI_SGML_DECL:
                switch( actChar ) {
                case '>':
                    offset++;
                    state = INIT;
                    return DECLARATION;
                case '-':
                    if( offset == tokenOffset ) {
                        state = ISA_SGML_DECL_DASH;
                        break;
                    } else {
                        return DECLARATION;
                    }
                case '\n':
                    if( offset == tokenOffset ) {
                        offset++;
                        return EOL;
                    } else {
                        return DECLARATION;
                    }
                }
                break;

            case ISA_SGML_DECL_DASH:
                if( actChar == '-' ) {
                    state = ISI_SGML_COMMENT;
                    break;
                } else {
                    state = ISI_SGML_DECL;
                    continue;
                }

            case ISI_SGML_COMMENT:
                switch( actChar ) {
                case '-':
                    state = ISA_SGML_COMMENT_DASH;
                    break;
                case '\n':
                    if( offset == tokenOffset ) {
                        offset++;
                        return EOL;
                    } else {
                        return SGML_COMMENT;
                    }
                }
                break;

            case ISA_SGML_COMMENT_DASH:
                if( actChar == '-' ) {
                    offset++;
                    state = ISI_SGML_DECL;
                    return SGML_COMMENT;
                } else {
                    state = ISI_SGML_COMMENT;
                    continue;
                }


            case ISA_REF:
                if( isAZ( actChar ) ) {
                    state = ISI_REF_NAME;
                    break;
                }
                if( actChar == '#' ) {
                    state = ISA_REF_HASH;
                    break;
                }
                state = subState;
                continue;

            case ISI_REF_NAME:
                if( isName( actChar ) ) break;
                if( actChar == ';' ) offset++;
                state = subState;
                return CHARACTER;

            case ISA_REF_HASH:
                if( actChar >= '0' && actChar <= '9' ) {
                    state = ISI_REF_DEC;
                    break;
                }
                if( actChar == 'x' || actChar == 'X' ) {
                    state = ISA_REF_X;
                    break;
                }
                if( isAZ( actChar ) ) {
                    offset++;
                    state = subState;
                    return ERROR;
                }
                state = subState;
                continue;

            case ISI_REF_DEC:
                if( actChar >= '0' && actChar <= '9' ) break;
                if( actChar == ';' ) offset++;
                state = subState;
                return CHARACTER;

            case ISA_REF_X:
                if( (actChar >= '0' && actChar <= '9') ||
                        (actChar >= 'a' && actChar <= 'f') ||
                        (actChar >= 'A' && actChar <= 'F')
                  ) {
                    state = ISI_REF_HEX;
                    break;
                }
                state = subState;
                return ERROR;       // error on previous "&#x" sequence

            case ISI_REF_HEX:
                if( (actChar >= '0' && actChar <= '9') ||
                        (actChar >= 'a' && actChar <= 'f') ||
                        (actChar >= 'A' && actChar <= 'F')
                  ) break;
                if( actChar == ';' ) offset++;
                state = subState;
                return CHARACTER;
            }

            offset = ++offset;
        } // end of while(offset...)

        /** At this stage there's no more text in the scanned buffer.
        * Scanner first checks whether this is completely the last
        * available buffer.
        */    
        //    if( lastBuffer ) {
        switch( state ) {
        case INIT:
        case ISI_TEXT:
        case ISA_LT:
        case ISA_SLASH:
        case ISA_SGML_ESCAPE:
        case ISA_SGML_DASH:
            return TEXT;

        case ISI_HTML_COMMENT:
        case ISA_HTML_COMMENT_DASH:
        case ISI_HTML_COMMENT_WS:
            return BLOCK_COMMENT;

        case ISI_TAG:
        case ISI_ENDTAG:
            return TAG;

        case ISI_ARG:
            return ARGUMENT;

        case ISI_ERROR:
            return ERROR;

        case ISP_ARG_WS:
        case ISP_TAG_WS:
        case ISP_ENDTAG_WS:
	case ISP_EQ_WS:
            return WS;

        case ISP_ARG_X:
        case ISP_TAG_X:
        case ISP_ENDTAG_X:
        case ISP_EQ:
            return WS;

        case ISI_VAL:
        case ISI_VAL_QUOT:
        case ISI_VAL_DQUOT:
            return VALUE;

        case ISI_SGML_DECL:
        case ISA_SGML_DECL_DASH:
            return DECLARATION;

        case ISI_SGML_COMMENT:
        case ISA_SGML_COMMENT_DASH:
            return SGML_COMMENT;

        case ISA_REF:
        case ISI_REF_NAME:
        case ISA_REF_HASH:
        case ISI_REF_DEC:
        case ISA_REF_X:
        case ISI_REF_HEX:
            return CHARACTER;
        }
        //    } else {
        //    }
        return EOT;
    }

    public String getTokenName(int tokenID) {
        switch (tokenID) {
        case TEXT:
            return TN_TEXT;
        case WS:
            return TN_WS;
        case ERROR:
            return TN_ERROR;
        case TAG:
            return TN_TAG;
        case ARGUMENT:
            return TN_ARGUMENT;
        case OPERATOR:
            return TN_OPERATOR;
        case VALUE:
            return TN_VALUE;
        case BLOCK_COMMENT:
            return TN_BLOCK_COMMENT;
        case SGML_COMMENT:
            return TN_SGML_COMMENT;
        case DECLARATION:
            return TN_DECLARATION;
        case CHARACTER:
            return TN_CHARACTER;
        default:
            return super.getTokenName(tokenID);
        }
    }

    public String getStateName(int stateNumber) {
        switch(stateNumber) {
        case INIT:
            return "INIT";          // NOI18N
        case ISI_TEXT:
            return "ISI_TEXT";      // NOI18N
        case ISA_LT:
            return "ISA_LT";        // NOI18N
        case ISA_SLASH:
            return "ISA_SLASH";     // NOI18N
        case ISA_SGML_ESCAPE:
            return "ISA_SGML_ESCAPE"; // NOI18N
        case ISA_SGML_DASH:
            return "ISA_SGML_DASH"; // NOI18N
        case ISI_HTML_COMMENT:
            return "ISI_HTML_COMMENT";// NOI18N
        case ISA_HTML_COMMENT_DASH:
            return "ISA_HTML_COMMENT_DASH";// NOI18N
        case ISI_HTML_COMMENT_WS:
            return "ISI_HTML_COMMENT_WS";// NOI18N
        case ISI_TAG:
            return "ISI_TAG";// NOI18N
        case ISI_ENDTAG:
            return "ISI_ENDTAG";// NOI18N
        case ISI_ARG:
            return "ISI_ARG";// NOI18N
        case ISI_ERROR:
            return "ISI_ERROR";// NOI18N
        case ISP_ARG_WS:
            return "ISP_ARG_WS";// NOI18N
        case ISP_TAG_WS:
            return "ISP_TAG_WS";// NOI18N
        case ISP_ENDTAG_WS:
            return "ISP_ENDTAG_WS";// NOI18N
        case ISP_ARG_X:
            return "ISP_ARG_X";// NOI18N
        case ISP_TAG_X:
            return "ISP_TAG_X";// NOI18N
        case ISP_ENDTAG_X:
            return "ISP_ENDTAG_X";// NOI18N
        case ISP_EQ:
            return "ISP_EQ";// NOI18N
        case ISI_VAL:
            return "ISI_VAL";// NOI18N
        case ISI_VAL_QUOT:
            return "ISI_VAL_QUOT";// NOI18N
        case ISI_VAL_DQUOT:
            return "ISI_VAL_DQUOT";// NOI18N
        case ISI_SGML_DECL:
            return "ISI_SGML_DECL";// NOI18N
        case ISA_SGML_DECL_DASH:
            return "ISA_SGML_DECL_DASH";// NOI18N
        case ISI_SGML_COMMENT:
            return "ISI_SGML_COMMENT";// NOI18N
        case ISA_SGML_COMMENT_DASH:
            return "ISA_SGML_COMMENT_DASH";// NOI18N
        case ISA_REF:
            return "ISA_REF";// NOI18N
        case ISI_REF_NAME:
            return "ISI_REF_NAME";// NOI18N
        case ISA_REF_HASH:
            return "ISA_REF_HASH";// NOI18N
        case ISI_REF_DEC:
            return "ISI_REF_DEC";// NOI18N
        case ISA_REF_X:
            return "ISA_REF_X";// NOI18N
        case ISI_REF_HEX:
            return "ISI_REF_HEX";// NOI18N
        default:
            return super.getStateName(stateNumber);
        }
    }

    /** Load valid mark state into the analyzer. Offsets
    * are already initialized when this method is called. This method
    * must get the state from the mark and set it to the analyzer. Then
    * it must decrease tokenOffset by the preScan stored in the mark state.
    * @param markState mark state to be loaded into syntax. It must be non-null value.
    */
    public void loadState(StateInfo stateInfo) {
        super.loadState( stateInfo );
        subState = ((HTMLStateInfo)stateInfo).getSubState();
    }

    /** Store state of this analyzer into given mark state. */
    public void storeState(StateInfo stateInfo) {
        super.storeState( stateInfo );
        ((HTMLStateInfo)stateInfo).setSubState( subState );
    }

    /** Compare state of this analyzer to given state info */
    public int compareState(StateInfo stateInfo) {
        if( super.compareState( stateInfo ) == DIFFERENT_STATE ) return DIFFERENT_STATE;
        return ( ((HTMLStateInfo)stateInfo).getSubState() == subState) ? EQUAL_STATE : DIFFERENT_STATE;
    }

    /** Create state info appropriate for particular analyzer */
    public StateInfo createStateInfo() {
        return new HTMLStateInfo();
    }


    /** Base implementation of the StateInfo interface */
    public static class HTMLStateInfo extends Syntax.BaseStateInfo {

        /** analyzer subState during parsing character references */
        private int subState;

        public int getSubState() {
            return subState;
        }

        public void setSubState(int subState) {
            this.subState = subState;
        }

        public String toString(Syntax syntax) {
            return super.toString(syntax) + ", subState=" + syntax.getStateName(getSubState());  // NOI18N
        }

    }


}

/*
 * Log
 *  15   Gandalf-post-FCS1.11.1.2    4/3/00   Petr Nejedly    Support for empty tags 
 *       like <P/>
 *  14   Gandalf-post-FCS1.11.1.1    3/31/00  Petr Jiricka    Fixed highestTokenID
 *  13   Gandalf-post-FCS1.11.1.0    3/31/00  Petr Nejedly    New HTML Syntax
 *  12   Gandalf   1.11        1/13/00  Miloslav Metelka Localization
 *  11   Gandalf   1.10        12/29/99 Petr Jiricka    Bugfix #4916 (for HTML 
 *       only)
 *  10   Gandalf   1.9         12/28/99 Miloslav Metelka 
 *  9    Gandalf   1.8         10/23/99 Ian Formanek    NO SEMANTIC CHANGE - Sun
 *       Microsystems Copyright in File Comment
 *  8    Gandalf   1.7         10/10/99 Miloslav Metelka 
 *  7    Gandalf   1.6         9/10/99  Miloslav Metelka 
 *  6    Gandalf   1.5         8/27/99  Miloslav Metelka 
 *  5    Gandalf   1.4         8/9/99   Petr Jiricka    Corrected bugs with 
 *       ending comment tag (-->) and with an equal sign (=) at the end of the 
 *       line
 *  4    Gandalf   1.3         7/20/99  Miloslav Metelka 
 *  3    Gandalf   1.2         6/22/99  Miloslav Metelka 
 *  2    Gandalf   1.1         6/8/99   Miloslav Metelka 
 *  1    Gandalf   1.0         6/1/99   Miloslav Metelka 
 * $
 */